Apprentissage par renforcement factorisé pour le comportement de personnages non joueurs

نویسندگان

Thomas Degris

Olivier Sigaud

Pierre-Henri Wuillemin

چکیده

In this paper, we apply a general reinforcement learning method to automatically design the behavior of non player characters of the Counter-Strike first person shooter computer game. The result of the learning process is a set of decision trees that represents compactly and easily readable a model of the problem itself and the decision policy of characters. Beyond this example, we discuss the potential benefits of our method to design the decision architecture of non player characters in commercial computer games. MOTS-CLÉS : Apprentissage par renforcement, Factorisation, Personnages non joueurs.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Apprentissage par Renforcement Inverse pour la Simulation d’Utilisateurs dans les Systèmes de Dialogue

Résumé : Les systèmes de dialogue sont des interfaces homme-machine qui utilisent le language naturel comme medium d’interaction. La simulation d’utilisateurs a pour objectif de simuler le comportement d’un utilisateur humain afin de générer artificiellement des dialogues. Cette étape est souvent essentielle dans la mesure où collecter et annoter des corpus de dialogues est un processus coûteux...

متن کامل

Classification structurée pour l'apprentissage par renforcement inverse

Résumé : Cette contribution traite du problème de l’apprentissage par imitation par le biais de l’apprentissage par renforcement inverse (ARI). Dans ce contexte, un expert accomplit une tâche qu’un agent artificiel doit essayer de reproduire. L’ARI part du postulat que l’expert optimise avec succès une fonction de récompense ; le problème consiste à deviner cette fonction à partir de traces du ...

متن کامل

Apprentissage par démonstrations : vaut-il la peine d’estimer une fonction de récompense?

Résumé : Cet article propose une étude comparative entre l’Apprentissage par Renforcement Inverse (ARI) et l’Apprentissage par Imitation (AI). L’ARI et l’AI sont deux cadres de travail qui utilisent le concept de Processus Décisionnel de Markov (PDM) et dans lesquels nous cherchons à résoudre le problème d’Apprentissage par Démonstrations (AD). L’AD est un problème où un agent appelé apprenti c...

متن کامل

Filtrage bayésien de la récompense

Résumé : Une large variété de schémas d’approximation de la fonction de valeur a été appliquée à l’apprentissage par renforcement. Cependant, les approches par filtrage bayésien, qui se sont pourtant montrées efficaces dans d’autres domaines comme l’apprentissage de paramètres pour les réseaux neuronaux, ont été peu étudiées jusqu’à présent. Cette contribution introduit un cadre de travail géné...

متن کامل

Apprentissage Par Renforcement : Analyse Des Crit Eres Moyens Et Pond Er Es En Hori- Zon Fini

E : Les probl emes de d ecision pos es par l'optimisation stochastique en horizon ni en l'absence de mod ele peuvent ^ etre trait es par des m ethodes adaptatives. Dii erents algorithmes d'apprentissage par renforcement ont et e propos es, tels le Q-Learning ou le R-Learning, mais ils sont d eenis pour des probl emes a horizon innni. On propose ici une mod elisation en horizon ni avec une compa...

متن کامل

ذخیره در منابع من

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

Revue d'Intelligence Artificielle

دوره 23 شماره

صفحات -

تاریخ انتشار 2009

Apprentissage par renforcement factorisé pour le comportement de personnages non joueurs

نویسندگان

چکیده

منابع مشابه

Apprentissage par Renforcement Inverse pour la Simulation d’Utilisateurs dans les Systèmes de Dialogue

Classification structurée pour l'apprentissage par renforcement inverse

Apprentissage par démonstrations : vaut-il la peine d’estimer une fonction de récompense?

Filtrage bayésien de la récompense

Apprentissage Par Renforcement : Analyse Des Crit Eres Moyens Et Pond Er Es En Hori- Zon Fini

عنوان ژورنال:

اشتراک گذاری